Comparación sobre Breakout

Comparación de aprendizaje entre Asteroids y Breakout

Se usa el método “Local Polynomial Regression Fitting” para hallar las líneas de tendencia.

Estadísticas de Asteroids

Estadísticas de Breakout

Comparacion de los diferentes agentes de Asteroids

Comparación con el agente para Asteroids con el C modificado

Comparación del valor Q

Comparación del puntaje

Comparación tomando el puntaje acumulado

Comparación con el agente para Asteroids sin las acciones aleatorias

Comparación de los valores Q

Comparación de los puntajes

Comparación de los dos ambientes bajo acciones aleatorias

##  asteroids_base   asteroids_no_random
##  Min.   : 110.0   Min.   : 430       
##  1st Qu.: 580.0   1st Qu.: 980       
##  Median : 930.0   Median :1300       
##  Mean   : 958.6   Mean   :1326       
##  3rd Qu.:1300.0   3rd Qu.:1560       
##  Max.   :3260.0   Max.   :3770
##      asteroids_base asteroids_no_random 
##            446.2923            450.6132
## No id variables; using all as measure variables

Distribuciones t-SNE

Comparación de densidades para t-SNE de Breakout

Comparación de las densidades de los t-SNE para Asteroids base y Breakout

COMPARACIÓN INJUSTA

Comparación de los valores Q del t-SNE para Asteroids base y Asteroids con C modificado

Comparacion de los tres agentes de Asteriods

##    Asteroids      Asteroids - Sin aleatoriedad Asteroids - C modificado
##  Min.   : 110.0   Min.   : 180.0               Min.   : 190.0          
##  1st Qu.: 260.0   1st Qu.: 480.0               1st Qu.: 530.0          
##  Median : 360.0   Median : 630.0               Median : 780.0          
##  Mean   : 396.2   Mean   : 664.8               Mean   : 815.3          
##  3rd Qu.: 480.0   3rd Qu.: 780.0               3rd Qu.:1080.0          
##  Max.   :1800.0   Max.   :1800.0               Max.   :1810.0
##                    Asteroids Asteroids - Sin aleatoriedad 
##                     195.0152                     222.4291 
##     Asteroids - C modificado 
##                     360.2606
## No id variables; using all as measure variables

Densidad de los valores Q

Asteroids base

Asteroids C

Asteroids sin acciones aleatorias

Breakout (Memoria de 1.000.000 de transiciones)

Breakout (Memoria de 120.000 de transiciones)